উপাত্তের বিস্তার পরিমাপ (Measures of Dispersion) হলো এমন একটি গাণিতিক কৌশল যা কোনো একটি ডেটাসেটের মানগুলির মধ্যে বৈচিত্র্য বা ছড়িয়ে পড়ার পরিমাণ নির্ণয় করে। এটি আমাদের বুঝতে সাহায্য করে, ডেটা পয়েন্টগুলি গড়ের কাছাকাছি আছে নাকি বেশ ছড়িয়ে আছে।
বিস্তার পরিমাপের কিছু প্রধান পদ্ধতি হলো:
পরিসীমা হলো ডেটাসেটের সর্বোচ্চ মান থেকে সর্বনিম্ন মান বিয়োগ করে প্রাপ্ত মান। এটি একটি সহজ এবং সাধারণ বিস্তার পরিমাপ। তবে এটি শুধুমাত্র ডেটাসেটের সবচেয়ে বড় এবং সবচেয়ে ছোট মানের ওপর নির্ভরশীল, তাই মাঝে অন্যান্য মানগুলোর প্রভাব পড়তে পারে না।
ফর্মুলা:
Range=Maximum value−Minimum value
গড় বিচ্যুতি হলো একটি ডেটাসেটের প্রতিটি মানের গড় (mean) থেকে তার বিচ্যুতির গড়। এটি ডেটাসেটের মানগুলোর গড় থেকে কতটুকু বিচ্যুত হচ্ছে, তা পরিমাপ করে।
ফর্মুলা:
Mean Deviation=1NN∑i=1|xi−μ|
এখানে,
বিচ্যুতি হলো প্রতিটি ডেটা পয়েন্টের গড় মান থেকে তার বিচ্যুতি (দ্বিগুণ) করে এর গড়। এটি ডেটাসেটের বিস্তৃতির পরিমাপ প্রদান করে। একটি কম বিচ্যুতি মানে ডেটা পয়েন্টগুলো গড়ের কাছাকাছি থাকে, আর একটি বড় বিচ্যুতি মানে ডেটা পয়েন্টগুলো বেশি ছড়িয়ে থাকে।
ফর্মুলা:
Variance=1NN∑i=1(xi−μ)2
এখানে,
প্রমিত বিচ্যুতি হলো বিচ্যুতির বর্গমূল। এটি ডেটাসেটের বিস্তার পরিমাপের আরো সাধারণ উপায়, কারণ এটি একই একক (unit) এ থাকে যা মূল ডেটার একক। এটি ডেটা পয়েন্টের গড় থেকে কতটুকু বিচ্যুতি হচ্ছে, তা স্পষ্টভাবে বোঝায়।
ফর্মুলা:
σ=√1NN∑i=1(xi−μ)2
এখানে,
কোয়ারটাইল বিচ্যুতি হলো প্রথম কোয়ারটাইল (Q1) এবং তৃতীয় কোয়ারটাইল (Q3) এর মধ্যে পার্থক্য। এটি ডেটাসেটের মধ্যবর্তী ৫০% ডেটা কতটুকু বিস্তৃত তা পরিমাপ করে। IQR হলো গড় মানের উপর নির্ভর না করে ডেটার স্ক্যাটারকে বিশ্লেষণ করে।
ফর্মুলা:
IQR=Q3−Q1
এখানে,
এগুলি হলো বিস্তার পরিমাপের কিছু গুরুত্বপূর্ণ পদ্ধতি, যেগুলি ডেটাসেটের বৈচিত্র্য বা পরিবর্তনশীলতা পরিমাপ করতে ব্যবহৃত হয়।
Read more